克雷西

0人工参与实现梯度更新!MIT新框架让AI自动生成微调数据,权重自主升级

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型终于学会更新自己了!MIT提出一种新的强化学习框架,让模型生成微调数据和自我更新指令,实现模型权重的更新。无需人工参与,模型就可以自动进行梯度更新,自主学习获取新知识或适应新任务。该框架名为SEAL(S

自主 mit seal incorporation 克雷西 2025-10-15 14:59  2